Una Representación Basada en Lógica Borrosa para el Clustering de páginas web con Mapas Auto-Organizativos

نویسندگان

  • Alberto Pérez García-Plaza
  • Víctor Fresno-Fernández
  • Raquel Martínez-Unanue
چکیده

This article evaluates a web page-oriented representation model for document clustering, using self-organizing maps. The representation is based on heuristic combinations of criteria by means of a fuzzy rules system. The experiments show an improvement in the proposed model behaviour versus traditional representations as TF, Bin-IDF and TF-IDF, with different vector dimensions, and using a reference collection.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Mejorando la accesibilidad de las aplicaciones GIS basadas en Web

El principal problema de los formatos vectoriales activos como WebCGM y Scalable Vector Graphics (SVG), radica en la necesidad de instalar plug-ins o descargar applets que permitan su visualización en la mayoría de los navegadores web. En este artículo se presenta un servicio web cuya funcionalidad permite la transformación de mapas vectoriales activos en formato SVG en una nueva representación...

متن کامل

Combinación de clasificadores para el análisis de sentimientos

Resumen. El presente trabajo, propone una arquitectura fusionando los clasificadores: SVM, árboles de decisión y Naive Bayes, mediante mayoŕıa de votos, ventanas y cascada, para explorar el desempeño de la tarea de análisis de sentimientos. Se utilizó un corpus en español de 2625 opiniones, previamente preprocesado. Para representarlo, se emplearon bigramas, bolsa de palabras con pesado tf-idf,...

متن کامل

Métodos de agrupamiento no supervisado para la integración de datos genómicos y metabólicos de múltiples líneas de introgresión

Las numerosas aplicaciones de la inteligencia artificial a la bioloǵıa de sistemas han dado lugar a nuevos algoritmos, además de la adaptación y reutilización de los existentes. En tareas de mineŕıa de datos se han aplicado diversos métodos estándar, como por ejemplo el bien conocido k-medias. Sin embargo, las capacidades de estos métodos son limitadas en relación a otros algoritmos más recient...

متن کامل

Un algoritmo para calcular #2SAT

Resumen. El problema de conteo de modelos en fórmulas booleanas pertenece a la clase #P-completo. Por tal motivo, no existe algoritmo qué, de forma eficiente, calcule el número exacto de modelos de una fórmula booleana. En este art́ıculo, se presenta una implementación para contar el número de modelos de una fórmula booleana basada en su representación mediante grafo. Aśı mismo se mostrará que, ...

متن کامل

Diseño de una Interfaz PCI para una Tarjeta Coprocesadora Basada en el DSP TMS320C40-40

n este artículo se presenta el diseño de una interfaz orientada al bus PCI basada en el controlador S5933 de AMCC y lógica programable. La interfaz está integrada en una tarjeta de coprocesamiento basada en el DSP TMS 320C40-40 de Texas Instruments. La interfaz permite transferencias de datos en modos esclavo y maestro del bus PCI. La tarjeta coprocesadora está destinada al tratamiento de gráfi...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 42  شماره 

صفحات  -

تاریخ انتشار 2009